智能论文笔记

Pitfalls of Conditional Batch Normalization for Contextual Multi-Modal Learning

Ivaxi Sheth , Aamer Abdul Rahman , Mohammad Havaei , Samira Ebrahimi Kahou

分类：计算机视觉

2022-11-28

Humans have perfected the art of learning from multiple modalities through sensory organs. Despite their impressive predictive performance on a single modality, neural networks cannot reach human level accuracy with respect to multiple modalities. This is a particularly challenging task due to variations in the structure of respective modalities. Conditional Batch Normalization (CBN) is a popular method that was proposed to learn contextual features to aid deep learning tasks. This technique uses auxiliary data to improve representational power by learning affine transformations for convolutional neural networks. Despite the boost in performance observed by using CBN layers, our work reveals that the visual features learned by introducing auxiliary data via CBN deteriorates. We perform comprehensive experiments to evaluate the brittleness of CBN networks to various datasets, suggesting that learning from visual features alone could often be superior for generalization. We evaluate CBN models on natural images for bird classification and histology images for cancer type classification. We observe that the CBN network learns close to no visual features on the bird classification dataset and partial visual features on the histology dataset. Our extensive experiments reveal that CBN may encourage shortcut learning between the auxiliary data and labels.

translated by 谷歌翻译

Exposing Surveillance Detection Routes via Reinforcement Learning, Attack Graphs, and Cyber Terrain

Lanxiao Huang , Tyler Cody , Christopher Redino , Abdul Rahman , Akshay Kakkar , Deepak Kushwaha , Cheng Wang , Ryan Clark , Daniel Radke , Peter Beling

分类：机器学习

2022-11-06

Reinforcement learning (RL) operating on attack graphs leveraging cyber terrain principles are used to develop reward and state associated with determination of surveillance detection routes (SDR). This work extends previous efforts on developing RL methods for path analysis within enterprise networks. This work focuses on building SDR where the routes focus on exploring the network services while trying to evade risk. RL is utilized to support the development of these routes by building a reward mechanism that would help in realization of these paths. The RL algorithm is modified to have a novel warm-up phase which decides in the initial exploration which areas of the network are safe to explore based on the rewards and penalty scale factor.

translated by 谷歌翻译

Quantifying the Online Long-Term Interest in Research

Murtuza Shahzad , Hamed Alhoori , Reva Freedman , Shaikh Abdul Rahman

分类：人工智能 | 机器学习

2022-09-13

在多个在线平台上的数量越来越多。尽管这些文章的学术影响得到了广泛的研究，但在线分享的在线兴趣仍不清楚。认识到在线提到的研究文章的时间对研究人员来说可能是有价值的信息。在本文中，我们分析了用户共享和/或讨论学术文章的多个社交媒体平台。我们建立了三个论文集群，根据年度在线提及的出版日期，范围从1920年到2016年。使用这三个群集中的每个集群使用在线社交媒体指标，我们构建了机器学习模型来预测长期的机器学习模型在线对研究文章的兴趣。我们采用两种不同的方法来解决预测任务：回归和分类。对于回归方法，多层感知器模型表现最好，对于分类方法，基于树的模型的性能比其他模型更好。我们发现，在经济和工业的背景下（即专利），旧文章最为明显。相比之下，最近发表的文章在研究平台（即Mendeley）之后是社交媒体平台（即Twitter）最为明显。

translated by 谷歌翻译

YouTube and Science: Models for Research Impact

Abdul Rahman Shaikh , Hamed Alhoori , Maoyuan Sun

分类：机器学习

2022-09-01

在过去的十年中，视频通信一直在迅速增加，YouTube提供了一种媒介，用户可以在其中发布，发现，共享和反应视频。引用研究文章的视频数量也有所增加，尤其是因为学术会议需要进行视频提交已变得相对普遍。但是，研究文章与YouTube视频之间的关系尚不清楚，本文的目的是解决此问题。我们使用YouTube视频创建了新的数据集，并在各种在线平台上提到了研究文章。我们发现，视频中引用的大多数文章都与医学和生物化学有关。我们通过统计技术和可视化分析了这些数据集，并建立了机器学习模型，以预测（1）视频中是否引用了研究文章，（2）视频中引用的研究文章是否达到了一定程度的知名度，以及（3）引用研究文章的视频是否流行。最佳模型的F1得分在80％至94％之间。根据我们的结果，在更多推文和新闻报道中提到的研究文章有更高的机会接收视频引用。我们还发现，视频观点对于预测引用和增加研究文章的普及和公众参与科学很重要。

translated by 谷歌翻译

Lateral Movement Detection Using User Behavioral Analysis

Deepak Kushwaha , Dhruv Nandakumar , Akshay Kakkar , Sanvi Gupta , Kevin Choi , Christopher Redino , Abdul Rahman , Sabthagiri Saravanan Chandramohan , Edward Bowen , Matthew Weeks

分类：机器学习

2022-08-29

横向移动是指威胁参与者最初访问网络的方法，然后逐步通过上述网络收集有关资产的关键数据，直到达到其攻击的最终目标。随着企业网络的复杂性和相互联系的性质的增加，横向移动侵入变得更加复杂，并且需要同样复杂的检测机制，以便在企业量表下实时实时地进行此类威胁。在本文中，作者提出了一种使用用户行为分析和机器学习的新颖，轻巧的方法，用于横向运动检测。具体而言，本文介绍了一种用于网络域特异性特征工程的新方法，该方法可以以每个用户为基础识别横向运动行为。此外，工程功能还被用于开发两个监督的机器学习模型，用于横向运动识别，这些模型在文献中显然超过了先前在文献中看到的模型，同时在具有高级失衡的数据集上保持了稳健的性能。本文介绍的模型和方法也已与安全操作员合作设计，以相关和可解释，以最大程度地发挥影响力并最大程度地减少作为网络威胁检测工具包的价值。本文的基本目标是为近实时的横向运动检测提供一种计算高效的，特定于域的方法，该检测对企业规模的数据量和类别不平衡是可解释且健壮的。

translated by 谷歌翻译

Unified Automatic Control of Vehicular Systems with Reinforcement Learning

Zhongxia Yan , Abdul Rahman Kreidieh , Eugene Vinitsky , Alexandre M. Bayen , Cathy Wu

分类：人工智能 | 机器人

2022-07-30

随着自动组件比例越来越多的新兴车辆系统提供了最佳控制的机会，以减轻交通拥堵和提高效率。最近有兴趣将深入增强学习（DRL）应用于这些非线性动力学系统，以自动设计有效的控制策略。尽管DRL是无模型的概念优势，但研究通常仍依赖于对特定车辆系统的艰苦训练设置。这是对各种车辆和机动性系统有效分析的关键挑战。为此，本文贡献了一种简化的用于车辆微仿真的方法，并以最少的手动设计发现了高性能控制策略。提出了一种可变的代理，多任务方法，以优化车辆部分观察到的马尔可夫决策过程。该方法在混合自治交通系统上进行了实验验证，该系统是自动化的。在六种不同的开放或封闭交通系统的所有配置中都可以观察到经验改进，通常比人类驾驶基线的15-60％。该研究揭示了许多紧急行为类似于缓解波浪，交通信号传导和坡道计量。最后，对新兴行为进行了分析，以产生可解释的控制策略，这些控制策略已通过学习的控制策略进行了验证。

translated by 谷歌翻译

AI Assurance using Causal Inference: Application to Public Policy

Andrei Svetovidov , Abdul Rahman , Feras A. Batarseh

分类：人工智能

2021-12-01

制定和实施基于AI的解决方案有助于国家和联邦政府机构，研究机构和商业公司加强决策过程，自动化连锁业务，减少自然和人力资源的消费。与此同时，实践中使用的大多数AI方法只能表示为“黑匣子”并遭受缺乏透明度。这最终可能导致意外的结果和破坏在这种系统中的信任。因此，至关重要，不仅要开发有效和强大的AI系统，而且为了确保其内部过程可解释和公平。我们本章的目标是利用美国经济技术部门的示例，介绍具有高影响决策的AI系统的保证方法的主题。我们通过提供技术经济数据集的因果试验，我们解释了这些领域如何从数据集的关键指标之间揭示致命关系。审查了几种因果推断方法和AI保证技术，并对数据转换为图形结构数据集。

translated by 谷歌翻译

Using Cyber Terrain in Reinforcement Learning for Penetration Testing

Rohit Gangupantulu , Tyler Cody , Paul Park , Abdul Rahman , Logan Eisenbeiser , Dan Radke , Ryan Clark

分类：机器学习

2021-08-16

但是，强化学习（RL）已应用于攻击渗透测试的攻击图，但是，受过训练的药物并不能反映现实，因为攻击图缺乏在战场的智能准备中通常捕获的操作细微差别（IPB），包括（网络）地形的概念。特别是，当前的实践构建攻击图专门使用常见漏洞评分系统（CVSS）及其组件。我们介绍了使用IPB概念在网络地形分析的障碍，接近途径，关键地形，观察和火场以及掩盖和隐藏的网络地形分析中构建攻击图的方法。我们在一个示例中演示了我们的方法，其中防火墙被视为障碍，并在（1）奖励空间和（2）状态动力学中表示。我们表明，地形分析可用于使现实主义攻击RL的图形。

translated by 谷歌翻译

Inter-Level Cooperation in Hierarchical Reinforcement Learning

Abdul Rahman Kreidieh , Glen Berseth , Brandon Trabucco , Samyak Parajuli , Sergey Levine , Alexandre M. Bayen

分类：机器学习 | 人工智能 | (统计)机器学习

2019-12-05

时间上解耦政策的层次结构提出了一种有希望的方法，可以在复杂的长期计划问题中实现结构化探索。为了完全实现这种方法，需要一种端到端的培训范式。然而，由于在层次结构中的目标分配和目标级别之间的相互作用，挑战，这些多级政策的培训已经有限。在本文中，我们将策略优化过程视为多智能agence过程。这使我们能够借鉴多代理RL的沟通与合作之间的联系，并展示了对整个政策培训绩效的子政策之间增加的合作的好处。通过修改目标函数和后续级别的更高级别政策，我们介绍了一种简单但有效的技术，可以通过修改目标函数和随后的渐变来诱导级别合作。关于各种模拟机器人和交通管制任务的实验结果表明，诱导合作导致更强大的表现，并提高了一套艰难的长时间地平任务的样本效率。我们还发现使用我们的方法训练的目标条件调节政策显示更好地转移到新任务，突出了我们在学习任务不可行的较低级别行为方面的方法的好处。视频和代码可在：https://sites.google.com/berkeley.edu/cooperative-hrl。

translated by 谷歌翻译

Applying Data Augmentation to Handwritten Arabic Numeral Recognition Using Deep Learning Neural Networks

Akm Ashiquzzaman , Abdul Kawsar Tushar , Md Ashiqur Rahman

分类：计算机视觉

2017-08-20

手写角色识别一直是模式识别和人工智能领域中的研究中心和基准问题，它仍然是一个充满挑战的研究主题。由于其庞大的应用程序，该领域的许多工作都集中在不同的语言上。阿拉伯语是一种多元化的语言，具有大量的研究范围，并带来了潜在的挑战。本文提出了一种用于识别阿拉伯语手写数字的卷积神经网络模型，该论文的数据集受到各种增强的约束，以增加深度学习方法所需的鲁棒性。提出的方法通过辍学的正则化来授权，以消除数据过度拟合的问题。此外，在激活函数中引入了合适的变化，以克服消失梯度的问题。通过这些修改，所提出的系统的精度为99.4 \％，其性能比数据集上的每项工作都更好。

translated by 谷歌翻译